home *** CD-ROM | disk | FTP | other *** search
/ PC World 2002 September / PCWorld_2002-09_cd.bin / Software / Vyzkuste / httrack / httrack-3.20RC4.exe / {app} / src / htsjava.c < prev    next >
C/C++ Source or Header  |  2002-04-30  |  9KB  |  396 lines

  1. /* ------------------------------------------------------------ */
  2. /*
  3. HTTrack Website Copier, Offline Browser for Windows and Unix
  4. Copyright (C) Xavier Roche and other contributors
  5.  
  6. This program is free software; you can redistribute it and/or
  7. modify it under the terms of the GNU General Public License
  8. as published by the Free Software Foundation; either version 2
  9. of the License, or any later version.
  10.  
  11. This program is distributed in the hope that it will be useful,
  12. but WITHOUT ANY WARRANTY; without even the implied warranty of
  13. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  14. GNU General Public License for more details.
  15.  
  16. You should have received a copy of the GNU General Public License
  17. along with this program; if not, write to the Free Software
  18. Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
  19.  
  20.  
  21. Important notes:
  22.  
  23. - We hereby ask people using this source NOT to use it in purpose of grabbing
  24. emails addresses, or collecting any other private information on persons.
  25. This would disgrace our work, and spoil the many hours we spent on it.
  26.  
  27.  
  28. Please visit our Website: http://www.httrack.com
  29. */
  30.  
  31.  
  32. /* ------------------------------------------------------------ */
  33. /* File: Java classes parser                                    */
  34. /* Author: Yann Philippot                                       */
  35. /* ------------------------------------------------------------ */
  36.  
  37.  
  38. /* Version: Oct/2000 */
  39. /* Fixed: problems with class structure (10/2000) */
  40.  
  41. // htsjava.c - Parseur de classes java
  42.  
  43. #include "stdio.h"
  44. #include "htssystem.h"
  45. #include "htscore.h"
  46. #include "htsjava.h"
  47.  
  48. #include <stdio.h>
  49. #include <stdlib.h>
  50. #include <string.h>
  51.  
  52. #include "htsnostatic.h"
  53.  
  54. //#include <math.h>
  55.  
  56. #ifndef HTS_LITTLE_ENDIAN
  57. #define REVERSE_ENDIAN 1
  58. #else
  59. #define REVERSE_ENDIAN 0
  60. #endif
  61.  
  62. /* big/little endian swap */
  63. #define hts_swap16(A) ( (((A) & 0xFF)<<8) | (((A) & 0xFF00)>>8) )
  64. #define hts_swap32(A) ( (( (hts_swap16(A)) & 0xFFFF)<<16) | (( (hts_swap16(A>>16)) & 0xFFFF)) )
  65.  
  66.  
  67. // ** HTS_xx sinon pas pris par VC++
  68. #define HTS_CLASS  7
  69. #define HTS_FIELDREF  9
  70. #define HTS_METHODREF  10
  71. #define HTS_STRING  8
  72. #define HTS_INTEGER  3
  73. #define HTS_FLOAT  4
  74. #define HTS_LONG  5
  75. #define HTS_DOUBLE  6
  76. #define HTS_INTERFACE  11
  77. #define HTS_NAMEANDTYPE  12
  78. #define HTS_ASCIZ  1
  79. #define HTS_UNICODE  2
  80.  
  81. #define JAVADEBUG 0
  82.  
  83. int hts_parse_java(char *file,char* err_msg)
  84. {
  85.   FILE *fpout;
  86.   JAVA_HEADER header;
  87.   RESP_STRUCT *tab;
  88.   
  89. #if JAVADEBUG
  90.   printf("fopen\n");
  91. #endif
  92.   if ((fpout = fopen(fconv(file), "r+b")) == NULL)
  93.   {
  94.     //fprintf(stderr, "Cannot open input file.\n");
  95.     sprintf(err_msg,"Unable to open file %s",file);
  96.     return 0;   // une erreur..
  97.   }
  98.     
  99. #if JAVADEBUG
  100.   printf("fread\n");
  101. #endif
  102.   //if (fread(&header,1,sizeof(JAVA_HEADER),fpout) != sizeof(JAVA_HEADER)) {   // pas complet..
  103.   if (fread(&header,1,10,fpout) != 10) {   // pas complet..
  104.     fclose(fpout);
  105.     sprintf(err_msg,"File header too small (file len = "LLintP")",(LLint)fsize(file));
  106.     return 0;
  107.   }
  108.  
  109. #if JAVADEBUG
  110.   printf("header\n");
  111. #endif
  112.   // tester en tΩte
  113. #if REVERSE_ENDIAN
  114.   header.magic = hts_swap32(header.magic);
  115.   header.count = hts_swap16(header.count); 
  116. #endif        
  117.   if(header.magic!=0xCAFEBABE) {
  118.     sprintf(err_msg,"non java file");
  119.     if (fpout) { fclose(fpout); fpout=NULL; }
  120.     return 0;
  121.   }
  122.  
  123.   tab =(RESP_STRUCT*)calloct(header.count,sizeof(RESP_STRUCT));
  124.   if (!tab) {
  125.     sprintf(err_msg,"Unable to alloc %d bytes",(int)sizeof(RESP_STRUCT));
  126.     if (fpout) { fclose(fpout); fpout=NULL; }
  127.     return 0;    // erreur..
  128.   }
  129.  
  130. #if JAVADEBUG
  131.   printf("calchead\n");
  132. #endif
  133.   {
  134.     int i;
  135.     
  136.     for (i = 1; i < header.count; i++) {
  137.       int err=0;  // ++    
  138.       tab[i]=readtable(fpout,tab[i],&err,err_msg);
  139.       if (!err) {
  140.         if ((tab[i].type == HTS_LONG) ||(tab[i].type == HTS_DOUBLE)) i++;  //2 element si double ou float
  141.       } else {    // ++ une erreur est survenue!
  142.         if (strnotempty(err_msg)==0)
  143.           strcpy(err_msg,"Internal readtable error");
  144.         freet(tab);
  145.         if (fpout) { fclose(fpout); fpout=NULL; }
  146.         return 0;
  147.       }
  148.     }
  149.     
  150.   }
  151.  
  152.   
  153. #if JAVADEBUG
  154.   printf("addfiles\n");
  155. #endif
  156.   {
  157.     unsigned int acess;
  158.     unsigned int Class;
  159.     unsigned int SClass;
  160.     int i;
  161.     acess = readshort(fpout);
  162.     Class = readshort(fpout);
  163.     SClass = readshort(fpout);
  164.     
  165.     for (i = 1; i <header.count; i++) {
  166.       
  167.       if (tab[i].type == HTS_CLASS) {
  168.         
  169.         if ((tab[i].index1<header.count) && (tab[i].index1>=0)) {
  170.           
  171.           
  172.           if((tab[i].index1!=SClass) && (tab[i].index1!=Class) && (tab[tab[i].index1].name[0]!='[')) {
  173.             
  174.             if(!strstr(tab[tab[i].index1].name,"java/")) {
  175.               char tempo[1024];
  176.               tempo[0]='\0';
  177.               
  178.               sprintf(tempo,"%s.class",tab[tab[i].index1].name);
  179. #if JAVADEBUG
  180.               printf("add %s\n",tempo);
  181. #endif
  182.               if (tab[tab[i].index1].file_position >= 0)
  183.                 hts_add_file(tempo,tab[tab[i].index1].file_position);
  184.             }
  185.             
  186.           }
  187.         } else { 
  188.           i=header.count;  // exit 
  189.         }
  190.       }
  191.       
  192.     }
  193.   }
  194.   
  195.  
  196. #if JAVADEBUG
  197.   printf("end\n");
  198. #endif
  199.   freet(tab);
  200.   if (fpout) { fclose(fpout); fpout=NULL; }
  201.   return 1;
  202. }
  203.  
  204.  
  205.  
  206.  
  207. // error: !=0 si erreur fatale
  208. RESP_STRUCT readtable(FILE *fp,RESP_STRUCT trans,int* error,char* err_msg)
  209. {
  210.   unsigned short int length;
  211.   int j;
  212.   *error = 0;  // pas d'erreur
  213.   trans.file_position=-1;
  214.   trans.type = (int)(unsigned char)fgetc(fp);
  215.   switch (trans.type) {
  216.   case HTS_CLASS:
  217.     strcpy(trans.name,"Class");
  218.     trans.index1 = readshort(fp);
  219.     break;
  220.     
  221.   case HTS_FIELDREF:
  222.     strcpy(trans.name,"Field Reference");
  223.     trans.index1 = readshort(fp);
  224.     readshort(fp);
  225.     break;
  226.     
  227.   case HTS_METHODREF:
  228.     strcpy(trans.name,"Method Reference");
  229.     trans.index1 = readshort(fp);
  230.     readshort(fp);
  231.     break;
  232.     
  233.   case HTS_INTERFACE:
  234.     strcpy(trans.name,"Interface Method Reference");
  235.     trans.index1 =readshort(fp);
  236.     readshort(fp);
  237.     break;
  238.   case HTS_NAMEANDTYPE:
  239.     strcpy(trans.name,"Name and Type");
  240.     trans.index1 = readshort(fp);
  241.     readshort(fp);
  242.     break;
  243.     
  244.   case HTS_STRING:                // CONSTANT_String
  245.     strcpy(trans.name,"String");
  246.     trans.index1 = readshort(fp);
  247.     break;
  248.     
  249.   case HTS_INTEGER:
  250.     strcpy(trans.name,"Integer");
  251.     for(j=0;j<4;j++) fgetc(fp);
  252.     break;
  253.     
  254.   case HTS_FLOAT:
  255.     strcpy(trans.name,"Float");
  256.     for(j=0;j<4;j++) fgetc(fp);
  257.     break;
  258.     
  259.   case HTS_LONG:
  260.     strcpy(trans.name,"Long");
  261.     for(j=0;j<8;j++) fgetc(fp);
  262.     break;
  263.   case HTS_DOUBLE:
  264.     strcpy(trans.name,"Double");
  265.     for(j=0;j<8;j++) fgetc(fp);
  266.     break;
  267.     
  268.   case HTS_ASCIZ:
  269.   case HTS_UNICODE:
  270.     
  271.     if (trans.type == HTS_ASCIZ)
  272.       strcpy(trans.name,"HTS_ASCIZ");
  273.     else
  274.       strcpy(trans.name,"HTS_UNICODE");
  275.     
  276.     {
  277.       char buffer[1024]; 
  278.       char *p;
  279.       
  280.       p=&buffer[0];
  281.  
  282.       //fflush(fp); 
  283.       trans.file_position=ftell(fp);
  284.       length = readshort(fp);
  285.       if (length<HTS_URLMAXSIZE) {
  286.         // while ((length > 0) && (length<500)) {
  287.         while (length > 0) {
  288.           *p++ =fgetc(fp);
  289.           
  290.           length--;
  291.         }
  292.         *p='\0';
  293.         
  294.         //#if JDEBUG
  295.         //      if(tris(buffer)==1) printf("%s\n ",buffer);
  296.         //      if(tris(buffer)==2)  printf("%s\n ",printname(buffer));
  297.         //#endif
  298.         if(tris(buffer)==1)  hts_add_file(buffer,trans.file_position);       
  299.         else if(tris(buffer)==2)  hts_add_file(printname(buffer),trans.file_position);
  300.  
  301.         strcpy(trans.name,buffer);
  302.       } else {    // gros pb
  303.         while ( (length > 0) && (!feof(fp))) {
  304.           fgetc(fp);
  305.           length--;
  306.         }
  307.         if (!feof(fp)) {
  308.           trans.type=-1;
  309.         } else {
  310.           sprintf(err_msg,"Internal stucture error (ASCII)");
  311.           *error = 1;
  312.         }
  313.         return(trans);
  314.       }
  315.     }
  316.     break;
  317.   default:
  318.     // printf("Type inconnue\n");
  319.     // on arrΩte tout 
  320.     sprintf(err_msg,"Internal structure unknown (type %d)",trans.type);
  321.     *error = 1;
  322.     return(trans);
  323.     break;
  324.   }  
  325.   return(trans);
  326. }
  327.  
  328.  
  329. unsigned short int readshort(FILE *fp)
  330. {
  331.   unsigned short int valint;
  332.   fread(&valint,sizeof(valint),1,fp);
  333.  
  334. #if REVERSE_ENDIAN
  335.   return hts_swap16(valint);
  336. #else
  337.   return valint;
  338. #endif
  339.   
  340. }
  341.  
  342. int tris(char * buffer)
  343. {
  344.   //
  345.   // Java
  346.   if((buffer[0]=='[') && buffer[1]=='L' && (!strstr(buffer,"java/")) ) 
  347.     return 2;
  348.   if (strstr(buffer,".gif") || strstr(buffer,".jpg") || strstr(buffer,".jpeg") || strstr(buffer,".au") ) 
  349.     return 1;
  350.   // Ajouts R.X: test type
  351.   // Autres fichiers
  352.   {
  353.     char type[256];
  354.     type[0]='\0';
  355.     get_httptype(type,buffer,0);
  356.     if (strnotempty(type))     // type reconnu!
  357.       return 1;
  358.     // ajout RX 05/2001
  359.     else if (is_dyntype(get_ext(buffer)))   // asp,cgi...
  360.       return 1;
  361.   }
  362.   return 0;
  363. }
  364.  
  365.  
  366. char * printname(char  name[1024])
  367. {
  368.   char* rname;
  369.   //char *rname;
  370.   char *p;
  371.   char *p1;
  372.   int j;
  373.   NOSTATIC_RESERVE(rname, char, 1024);
  374.   rname[0]='\0';
  375.   //
  376.  
  377.   p=&name[0];
  378.   
  379.   if(*p!='[')  return "";
  380.   p+=2;
  381.   //rname=(char*)calloct(strlen(name)+8,sizeof(char));
  382.   p1=rname;
  383.   for (j = 0; j < (int) strlen(name); j++,p++) {
  384.     if (*p == '/') *p1='.'; 
  385.     if (*p==';'){*p1='\0';
  386.     strcat(rname,".class");
  387.     return (rname);}
  388.     else *p1=*p;
  389.     p1++;
  390.   }
  391.   p1-=3;
  392.   *p1='\0';
  393.   return (rname);
  394.   
  395. }
  396.